10/573,262 



Sequence Alignments 



Q6 8HV1_M0USE 

ID Q68HV1_M0USE PRELIMINARY; PRT; 1925 AA. 

AC Q6 8HV1; 

DT ll-OCT-2004, integrated into UniProtKB/TrEMBL . 

DT ll-OCT-2004, sequence version 1. 

DT 13-JUN-2006, entry version 11. 

DE Plexin Dl . 

GN Name=Plxndl; 

OS Mus musculus (Mouse) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

OC Mammalia; Eutheria; Euarchontoglires ; Glires; Rodentia; Sciurognathi ; 

OC Muroidea; Muridae; Murinae; Mus. 

OX NCBI_TaxID=10090; 

RN [1] 

RP NUCLEOTIDE SEQUENCE. 

RC STRAIN=BALB/c; 

RA Duke-Cohan J.S., Ahmed W., Reinherz E.L.; 

RT "Identification of mouse plexin Dl."; 

RL Submitted (JUL-2004) to the EMBL/ GenBank/DDBJ databases. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDer ivs License 

CC 

DR EMBL; AY688678; AAT99561.1; -; mRNA. 

DR UniGene; Mm. 3085; -. 

DR Ensembl; ENSMUSG00000030123; Mus musculus. 

DR MGI; MGI:2154244; Plxndl . 

DR RZPD-ProtExp; IOM17766; -. 

DR GO; GO: 0005886; C: plasma membrane; IC. 

DR GO; GO: 0005515; F:protein binding; IPI . 

DR GO; GO:0017154; F:semaphorin receptor activity; IPI. 

DR GO; GO: 0001569; P:patterning of blood vessels; IMP. 

DR InterPro; IPR002909; IPT_TIG_rcpt . 

DR InterPro; IPR003659; Plexin-like. 

DR InterPro; IPR013548; Plexin_cytopl . 

DR InterPro; IPR002165; Plexin_repeat . 

DR InterPro; IPR008936; Rho_GAP . 

DR InterPro; IPR001627; Sema. 

DR Pfam; PF0 833 7; Plexin_cytopl ; 1. 

DR Pfam; PF01437; PSI; 2. 

DR Pfam; PF01403; Sema; 1. 

DR Pfam; PF01833; TIG; 3. 

DR SMART; SM00429; IPT; 3. 

DR SMART; SM00423; PSI; 3. 

DR SMART; SM00630; Sema; 1. 

DR PROSITE; PS51004; SEMA; 1. 

SQ SEQUENCE 1925 AA; 211638 MW; 53E71ADBD05A78FC CRC64; 

Query Match 100.0%; Score 9181; DB 2; Length 1925; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1746; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 



1 SMLNVAANHPNASTVGLVLPPTSGTGGSRLLVGATYTGFGSAFFPRNRSLEDHRFENTPE 6 0 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

180 SMLNVAANHPNASTVGLVLPPTSGTGGSRLLVGATYTGFGSAFFPRNRSLEDHRFENTPE 239 

61 IAIRSLDARGDLAKLFTFDLNPSDDNILKIKQGAKEQHKLGFVRAFLHPAVPPHSAQPYA 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 40 IAIRSLDARGDLAKLFTFDLNPSDDNILKIKQGAKEQHKLGFVRAFLHPAVPPHSAQPYA 299 

121 YLALNSEARAGDKDSQARSLLARICLPRGAGGDAKKLTESYIQLGLQCAGGAGRGDLYSR 18 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
300 YLALNSEARAGDKDSQARSLLARICLPRGAGGDAKKLTESYIQLGLQCAGGAGRGDLYSR 359 

181 LVSVFPAREQFFAVFERPQGAPGARNAPAALCAFRFDDVQAAIRAARTACFVEPAPDWA 2 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

36 0 LVSVFPAREQFFAVFERPQGAPGARNAPAALCAFRFDDVQAAIRAARTACFVEPAPDWA 419 

2 41 VLDSWQGTGPACESKRNIQLQPEQLDCGAAHLQHPLTILQPLRASPVFRAPGLTAVAVA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
42 0 VLDSWQGTGPACESKRNIQLQPEQLDCGAAHLQHPLTILQPLRASPVFRAPGLTAVAVA 4 79 

3 01 SANNYTAVFLGTATGRLLKI SLNESMQWSRRVLTVAYGEPVHHVMQFDPMDPGYLYLMT 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 8 0 SANNYTAVFLGTATGRLLKI SLNESMQWSRRVLTVAYGEPVHHVMQFDPMDPGYLYLMT 539 

361 SHQMARVKVAACEVHSTCGDCVGAADAYCGWCTLETRCTLQQDCTNSSQPHFWTSASEGP 42 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

540 SHQMARVKVAACEVHSTCGDCVGAADAYCGWCTLETRCTLQQDCTNSSQPHFWTSASEGP 599 

421 SRCPAMTVLPSEIDVHRDYTGMILQISGSLPSLSGMEMACDYGNGVRTVARVPGPAYDHQ 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
600 SRCPAMTVLPSEIDVHRDYTGMILQISGSLPSLSGMEMACDYGNGVRTVARVPGPAYDHQ 659 

481 IAYCNLLPRAQFPSFPAGQDHVTVEMSVRVKGHNIVSANFTIYDCSRIGQVYPHTACTSC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
66 0 IAYCNLLPRAQFPSFPAGQDHVTVEMSVRVKGHNIVSANFTIYDCSRIGQVYPHTACTSC 719 

541 LSTQWPCSWCIQLHSCVSNQSQCQDSPNPTSPQDCPQILPSPLAPVPTGGSQDILVPLTK 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

72 0 LSTQWPCSWCIQLHSCVSNQSQCQDSPNPTSPQDCPQILPSPLAPVPTGGSQDILVPLTK 7 79 

6 01 ATFFHGSSLECSFGLEESFEAVWANNSLVRCNQWLHTTQKSQVFPLSLKLKGPPDRFLD 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
78 0 ATFFHGSSLECSFGLEESFEAVWANNSLVRCNQWLHTTQKSQVFPLSLKLKGPPDRFLD 839 

661 SPNPMTVWYNCAMGSPDCSQCLGREDLGHLCVWNDGCRLRGPLQPLPGTCPAPEIRAIE 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
8 40 SPNPMTVWYNCAMGSPDCSQCLGREDLGHLCVWNDGCRLRGPLQPLPGTCPAPEIRAIE 899 

721 PLSGPLDGGTLLTIRGRNLGRRLSDVAHGVWIGSVACEPLADRYTVSEEIVCATGPAAGA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
900 PLSGPLDGGTLLTIRGRNLGRRLSDVAHGVWIGSVACEPLADRYTVSEEIVCATGPAAGA 959 

781 FSDWTVNVSKEGRSREQFSYVLPTVHSLEPSMGPKAGGTRITIHGSDLNVGSMLQVLVN 8 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
96 0 FSDWTVNVSKEGRSREQFSYVLPTVHSLEPSMGPKAGGTRITIHGSDLNVGSMLQVLVN 1019 

8 41 DTDPCTDLTRTATS I TCTVPGGTLPSPVPVCVRFESRGCVHGNLTFWYMQNPVI TAI SPG 9 0 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



102 0 DTDPCTDLTRTATSITCTVPGGTLPSPVPVCVRFESRGCVHGNLTFWYMQNPVITAISPG 10 79 

901 RSPVSGGRTITVAGERFHMVQNVSMAVHHIGREPTFCKVLNSTLITCPSPGALSNASAPV 96 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1080 RSPVSGGRTITVAGERFHMVQNVSMAVHHIGREPTFCKVLNSTLITCPSPGALSNASAPV 1139 

961 DFFINGRAYADEAAEELLDPAEAQRGSRFRLDYLPNPQFSTAKREKWIKHHPGEPLTLVI 102 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
114 0 DFF INGRAYADEAAEELLDPAEAQRGSRFRLDYLPNPQFSTAKREKWIKHHPGEPLTLVI 1199 

1021 HKEQDSLGLESHEYHIKIGQVSCDIQIISDRVIHCSVNESLGTAEGQLPITIQVGNFNQT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 0 0 HKEQDSLGLESHEYHIKIGQVSCDIQIISDRVIHCSVNESLGTAEGQLPITIQVGNFNQT 12 59 

10 81 IATLQLGGSETAIWS IVICSVLLLLSWALFVFCTKSRRAERYWQKTLLQMEEMESQIR 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
126 0 IATLQLGGSETAIWS IVICSVLLLLSWALFVFCTKSRRAERYWQKTLLQMEEMESQIR 1319 

1141 EEIRKGFAELQTDMTDLTKELNRSQGIPFLEYKHFVTRTFFPKCSSLYEERYVLPSKTLN 12 0 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
132 0 EEIRKGFAELQTDMTDLTKELNRSQGIPFLEYKHFVTRTFFPKCSSLYEERYVLPSKTLN 13 79 

12 01 SQGGSPPQETHPLLGEWNIPEHCRPSMEEGISLFSSLLNNKHFLIVFVHALEQQKDFAVR 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

13 8 0 SQGGSPPQETHPLLGEWNIPEHCRPSMEEGISLFSSLLNNKHFLIVFVHALEQQKDFAVR 1439 

1261 DRCSLASLLTIALHGKLEYYTSIMKELLVDLIDASAAKNPKLMLRRTESWEKMLTNWMS 132 0 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1440 DRCSLASLLTIALHGKLEYYTSIMKELLVDLIDASAAKNPKLMLRRTESWEKMLTNWMS 1499 

1321 ICMYGCLRETVGEPFFLLLCAIKQQINKGSIDAITGKARYTLNEEWLLRENIEAKPRNLN 13 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
150 0 ICMYGCLRETVGEPFFLLLCAIKQQINKGSIDAITGKARYTLNEEWLLRENIEAKPRNLN 1559 

13 81 VSFQGCGMDSLSVRAMDTDTLTQVKEKILEAFCKNVPYSQWPRAEDVDLEWFASSTQSYV 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
156 0 VSFQGCGMDSLSVRAMDTDTLTQVKEKILEAFCKNVPYSQWPRAEDVDLEWFASSTQSYV 1619 

1441 LRDLDDTSWEDGRKKLNTLAHYKIPEGASLAMSLTDKKDSTLGRVKDLDTEKYFHLVLP 150 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

162 0 LRDLDDTSWEDGRKKLNTLAHYKIPEGASLAMSLTDKKDSTLGRVKDLDTEKYFHLVLP 16 79 

1501 TDELVEPKKSHRQSHRKKVLPEIYLTRLLSTKGTLQKFLDDLFKAILSIREDKPPLAVKY 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
16 8 0 TDELVEPKKSHRQSHRKKVLPEIYLTRLLSTKGTLQKFLDDLFKAILSIREDKPPLAVKY 1739 

1561 FFDFLEEQAEKRGISDPDTLHIWKTNSLPLRFWVNILKNPQFVFDIEKTDHIDACLSVIA 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1740 FFDFLEEQAEKRGISDPDTLHIWKTNSLPLRFWVNILKNPQFVFDIEKTDHIDACLSVIA 1799 

1621 QAFIDACSISDLQLGKDSPTNKLLYAKEIPEYRKTVQRYYKQIQDMTPLSEQEMNAHLAE 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1800 QAFIDACSISDLQLGKDSPTNKLLYAKEIPEYRKTVQRYYKQIQDMTPLSEQEMNAHLAE 1859 

16 81 ESRKYQNEFNTNVAMAEIYKYAKRYRPQIMAALEANPTARRTQLQHKFEQWALMENNIY 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
186 0 ESRKYQNEFNTNVAMAEIYKYAKRYRPQIMAALEANPTARRTQLQHKFEQWALMENNIY 1919 



Qy 1741 ECYSEA 1746 

I I I I I I 

Db 1920 ECYSEA 1925 



RESULT 4 
PLXD1_HUMAN 

ID PLXD1_HUMAN STANDARD; PRT; 1925 AA. 

AC Q9Y4D7; Q6PJS9; Q8IZJ2; Q9BTQ2; 

DT 31-AUG-2004, integrated into UniProtKB/Swiss-Prot . 

DT 31-AUG-2004, sequence version 2. 

DT 25-JUL-2006, entry version 36. 

DE Plexin-Dl precursor. 

GN Name=PLXNDl; Synonyms=KIAA0620 ; 

OS Homo sapiens (Human) . 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

OC Mammalia; Eutheria; Euarchontoglires ; Primates; Haplorrhini; 

OC Catarrhini; Hominidae; Homo. 

OX NCBI_TaxID=9606; 

RN [1] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] (ISOFORM 1). 

RC TISSUE=Brain; 

RX MEDLINE=984 03880; PubMed=9734811 ; DOI=l 0 . 1 093 /dnares/5 . 3 . 169 ; 

RA Ishikawa K., Nagase T., Suyama M., Miyajima N., Tanaka A., Kotani H., 

RA Nomura N., Ohara 0.; 

RT "Prediction of the coding sequences of unidentified human genes. X. 

RT The complete sequences of 100 new cDNA clones from brain which can 

RT code for large proteins in vitro."; 

RL DNA Res. 5:169-176(1998). 

RN [2] 

RP NUCLEOTIDE SEQUENCE [MRNA] (ISOFORM 1), AND TISSUE SPECIFICITY. 

RX MEDLINE=22299888; PubMed=12412018 ; DOI=10 . 1 0 02 /dvdy . 1 0 159 ; 

RA van der Zwaag B., Hellemons A.J.C.G.M., Leenders W.P.J. , 

RA Burbach J.P.H., Brunner H.G., Padberg G.W., Van Bokhoven H.; 

RT "PLEXIN-D1, a novel plexin family member, is expressed in vascular 

RT endothelium and the central nervous system during mouse 

RT embryogenesis . " ; 

RL Dev. Dyn. 225:336-3 43(2 0 02). 

RN [3] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] OF 1386-1925 (ISOFORMS 1 AND 

RP 2) . 

RC TISSUE=Muscle, and Uterus; 

RX MEDLINE=22388257; PubMed=12477932 ; DOI = 10 . 1073/pnas . 242603899 ; 

RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., 

RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., 

RA Altschul S.F., Zeeberg B., Buetow K.H., Schaefer C.F., Bhat N.K., 

RA Hopkins R.F., Jordan H., Moore T., Max S.I., Wang J., Hsieh F., 

RA Diatchenko L., Marusina K., Farmer A. A., Rubin G.M., Hong L., 

RA Stapleton M., Soares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., 

RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, 

RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., 

RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J. A., Gunaratne P.H., 

RA Richards S., Worley K.C., Hale S., Garcia A.M., Gay L.J., Hulyk S.W., 

RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A., 

RA Fahey J., Helton E., Ketteman M., Madan A., Rodrigues S., Sanchez A., 

RA Whiting M., Madan A., Young A.C., Shevchenko Y . , Bouffard G.G., 

RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., 

RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., 

RA Butterfield Y.S.N. , Krzywinski M.I., Skalska U., Smailus D.E., 

RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A. ; 

RT "Generation and initial analysis of more than 15,000 full-length human 

RT and mouse cDNA sequences."; 



RL Proc. Natl. Acad. Sci. U.S.A. 99:16899-169 03(2 0 02). 

RN [4] 

RP GLYCOSYLATION [LARGE SCALE ANALYSIS] AT ASN-500, AND MASS 

RP SPECTROMETRY. 

RX PubMed=16335952; DOI=10 . 1021/pr0502065; 

RA Liu T . , Qian W.-J., Gritsenko M.A., Camp D.G. II, Monroe M.E., 

RA Moore R.J., Smith R.D.; 

RT "Human plasma N-glycoproteome analysis by immunoaf f inity subtraction, 

RT hydrazide chemistry, and mass spectrometry."; 

RL J. Proteome Res. 4:2070-2080(2005). 

CC -!- ALTERNATIVE PRODUCTS: 

CC Event=Alternative splicing; Named isoforms=2; 

CC Name=l; 

CC IsoId=Q9Y4D7-l; Sequence=Displayed; 

CC Name=2 ; 

CC IsoId=Q9Y4D7-2; Sequence=VSP_011516 ; 

CC -!- TISSUE SPECIFICITY: Detected at low levels in heart, placenta, 
CC lung, skeletal muscle, kidney, thymus and liver. Detected at very 

CC low levels in brain, colon, spleen, small intestine and peripheral 

CC blood leukocytes. 

CC -!- SIMILARITY: Belongs to the plexin family. 

CC -!- SIMILARITY: Contains 3 IPT/TIG domains. 

CC -!- SIMILARITY: Contains 1 Sema domain. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribution-NoDerivs License 

CC 

DR EMBL; AB014520; BAA31595.1; ALT_INIT; mRNA. 

DR EMBL; AY116661; AAM49063.1; -; mRNA. 

DR EMBL; BC003526; AAH03526.1; -; mRNA. 

DR EMBL; BC011848; AAH11848.1; -; mRNA. 

DR UniGene; Hs. 301685; -. 

DR Ensembl; ENSG00000004399 ; Homo sapiens. 

DR HGNC; HGNC:9107; PLXND1 . 

DR MIM; 604282; gene. 

DR InterPro; IPR002909; IPT_TIG_rcpt . 

DR InterPro; IPR003659; Plexin-like. 

DR InterPro; IPR013548; Plexin_cytopl . 

DR InterPro; IPR002165; Plexin_repeat . 

DR InterPro; IPR008936; Rho_GAP . 

DR InterPro; IPR001627; Sema. 

DR Pfam; PF0 833 7; Plexin_cytopl ; 1. 

DR Pfam; PF01437; PSI; 2. 

DR Pfam; PF01403; Sema; 1. 

DR Pfam; PF01833; TIG; 3. 

DR SMART; SM00429; IPT; 3. 

DR SMART; SM00423; PSI; 3. 

DR SMART; SM00630; Sema; 1. 

DR PROSITE; PS51004; SEMA; 1. 

KW Alternative splicing; Glycoprotein; Membrane; Polymorphism; Receptor; 

KW Repeat; Signal; Transmembrane. 

FT SIGNAL 1 46 Potential. 

FT CHAIN 47 1925 Plexin-Dl . 

FT /FTId=PRO_0000024676 . 

FT TOPO_DOM 47 1271 Extracellular (Potential) . 

FT TRANSMEM 1272 1292 Potential. 

FT TOPO_DOM 1293 1925 Cytoplasmic (Potential) . 



FT 


DOMAIN 


47 


546 








FT 


DOMAIN 


891 


979 


IPT/TIG 1 






FT 


DOMAIN 


981 


1066 


IPT/TIG 2 






FT 


DOMAIN 


1069 


1160 


IPT/TIG 3 






FT 


CARBOHYD 


86 


86 


N-linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


155 


155 


N-linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


188 


188 


N-linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


224 


224 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


481 


481 


N-linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


500 


500 


N-linked 


(GlcNAc. . 


. ) • 


FT 


CARBOHYD 


583 


583 


N-linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


696 


696 


N-linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


736 


736 


N— linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


802 


802 


N— linked 


(GlcNAc. . 


. ) (Potential ) . 


FT 


CARBOHYD 


965 


965 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1017 


1017 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1060 


1060 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1099 


1099 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1118 


1118 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1132 


1132 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1237 


1237 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


CARBOHYD 


1257 


1257 


N-linked 


(GlcNAc. . 


. ) (Potential) . 


FT 


VAR_SEQ 


1766 


1925 


S LPLRFWVtT I LKUPQFYFD I DKTDH I DACL CVI AQAF I D AC 



SQ SEQUENCE 



870 870 
1925 AA; 212095 



SISDLQL IQDMTP 
L5EQEMNAHLAEESRKYQNEFNTNVAMAE I YKYAKRYRPQI 
MAALEANPTARRTQLQHKFEQWALMEDNIYECYSEA -> 
RWRPSSPVLGEHPEEPPVCL (in isoform 2). 
/FTId=VSP_011516. 
M -> V (in dbSNP:2255703) . 
/FTId=VAR_022144. 
MW; 26001F5D0B2A80E5 CRC64; 



Query Match 92.2%; 
Best Local Similarity 91.9%; 
Matches 1606; Conservative 5 



Score 8468; DB 1; Length 1925; 
Pred. No. 0; 

>; Mismatches 88; Indels 2; 



Qy 1 SMLNVAANHPNASTVGLVLPPTSGTGGSRLLVGATYTGFGSAFFPRNRSLEDHRFENTPE 6 0 

I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I : I I : I I I I I I I I I I I I I I I I I I 
Db 178 SMLNVAANHPNASTVGLVLPPAAGAGGSRLLVGATYTGYGSSFFPRNRSLEDHRFENTPE 237 

Qy 61 IAIRSLDARGDLAKLFTFDLNPSDDNILKIKQGAKEQHKLGFVRAFLHPAVPPHSAQPYA 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill: II II II 
Db 238 IAIRSLDTRGDLAKLFTFDLNPSDDNILKIKQGAKEQHKLGFVSAFLHPSDPPPGAQSYA 297 

Qy 121 YLALNSEARAGDKDSQARSLLARICLPRGAGGDAKKLTESYIQLGLQCAGGAGRGDLYSR 180 

Db 29 8 YLALNSEARAGDKESQARSLLARICLPHGAGGDAKKLTESYIQLGLQCAGGAGRGDLYSR 357 

Qy 181 LVSVFPAREQFFAVFERPQGAPGARNAPAALCAFRFDDVQAAIRAARTACFVEPAPDWA 2 40 

I I I I I I I I I : 111111111:1 II I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I 
Db 358 LVSVFPARERLFAVFERPQGSPAARAAPAALCAFRFADVRAAIRAARTACFVEPAPDWA 417 



Qy 2 41 VLDSWQGTGPACESKRNIQLQPEQLDCGAAHLQHPLTILQPLRASPVFRAPGLTAVAVA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I : I : I I I I I I I I I : I I I I 
Db 418 VLDSWQGTGPACERKLNIQLQPEQLDCGAAHLQHPLSILQPLKATPVFRAPGLTS VAVA 477 



3 01 SANNYTAVFLGTATGRLLKISLNESMQWSRRVLTVAYGEPVHHVMQFDPMDPGYLYLMT 36 0 

I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I 

478 SVNNYTAVFLGTVNGRLLKINLNESMQWSRRWTVAYGEPVHHVMQFDPADSVYLYLMT 53 7 

361 SHQMARVKVAACEVHSTCGDCVGAADAYCGWCTLETRCTLQQDCTNSSQPHFWTSASEGP 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

53 8 SHQMARVKVAACNVHSTCGDCVGAADAYCGWCALETRCTLQQDCTNSSQQHFWTSASEGP 59 7 

421 SRCPAMTVLPSEIDVHRDYTGMILQISGSLPSLSGMEMACDYGNGVRTVARVPGPAYDHQ 48 0 

I I I I I I I I I I I I I I I : : I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I : II 

59 8 SRCPAMTVLPSEIDVRQEYPGMILQISGSLPSLSGMEMACDYGNNIRTVARVPGPAFGHQ 657 

481 IAYCNLLPRAQFPSFPAGQDHVTVEMSVRVKGHNIVSANFTIYDCSRIGQVYPHTACTSC 540 

I I I I I I I I I III II II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

658 IAYCNLLPRDQFPPFPPNQDHVTVEMSVRVNGRNIVKANFTIYDCSRTAQVYPHTACTSC 717 

541 LSTQWPCSWCIQLHSCVSNQSQCQDSPNPTSPQDCPQILPSPLAPVPTGGSQDILVPLTK 600 

II I I I I II I 11111111:1: I I I I I I I I I I I : I I I I I I I I I I I I I : I I I I I 

718 LSAQWPCFWCSQQHSCVSNQSRCEASPNPTSPQDCPRTLLSPLAPVPTGGSQNILVPLAN 777 

6 01 ATFFHGSSLECSFGLEESFEAVWANNSLVRCNQWLHTTQKSQVFPLSLKLKGPPDRFLD 66 0 

II I :: I I I I I I I I I I I I I I I I : I I I : I I I I I I I : I I I I I I I I I : I I I I I I I I 

778 TAFFQGAALECSFGLEEIFEAVWVNESWRCDQWLHTTRKSQVFPLSLQLKGRPARFLD 837 

661 SPNPMTVWYNCAMGSPDCSQCLGREDLGHLCVWNDGCRLRGPLQPLPGTCPAPEIRAIE 72 0 

II I I I I : I I I I I I I I I I I I I I I I I I I I I I I I : I : I I I I I I I I I I I : I I I I I I I I I I I I 

83 8 SPEPMTVMVYNCAMGSPDCSQCLGREDLGHLCMWSDGCRLRGPLQPMAGTCPAPEIRAIE 89 7 

721 PLSGPLDGGTLLTIRGRNLGRRLSDVAHGVWIGSVACEPLADRYTVSEEIVCATGPAAGA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

89 8 PLSGPLDGGTLLTIRGRNLGRRLSDVAHGVWIGGVACEPLPDRYTVSEEIVCVTGPAPGP 957 

781 FSDWTVNVSKEGRSREQFSYVLPTVHSLEPSMGPKAGGTRITIHGSDLNVGSMLQVLVN 8 40 

I I I I I I I I I I : I I :: I I I I I I I I I I I I : I I I I I I I I I I I I I I : I I : I I I I I I I I I 

958 LSGWTVNASKEGKSRDRFSYVLPLVHSLEPTMGPKAGGTRITIHGNDLHVGSELQVLVN 1017 

8 41 DTDPCTDLTRTATS I TCTVPGGTLPSPVPVCVRFESRGCVHGNLTFWYMQNPVI TAI SPG 9 0 0 
I I I I I I : I II III 11:1 I 11:111111111 I I I I I I I I I I I I I I I I I I I I I I I 

1018 DTDPCTELMRTDTS I ACTMPEGALPAPVPVCVRFERRGCVHGNLTFWYMQNPVI TAI SPR 10 7 7 

901 RSPVSGGRTITVAGERFHMVQNVSMAVHHIGREPTFCKVLNSTLITCPSPGALSNASAPV 96 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

10 78 RSPVSGGRTITVAGERFHMVQNVSMAVHHIGREPTLCKVLNSTLITCPSPGALSNASAPV 113 7 

961 DFFINGRAYADE — AAEELLDPAEAQRGSRFRLDYLPNPQFSTAKREKWIKHHPGEPLTL 1018 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

113 8 DFFINGRAYADEVAVAEELLDPEEAQRGSRFRLDYLPNPQFSTAKREKWIKHHPGEPLTL 119 7 

1019 VIHKEQDSLGLESHEYHIKIGQVSCDIQIISDRVIHCSVNESLGTAEGQLPITIQVGNFN 10 78 

I I I I I I I I I I I : I I I I : I I I I I I I I I I I : I I I : I I I I I I I I I I I I I I I I I I I I I I I I 

119 8 VIHKEQDSLGLQSHEYRVKIGQVSCDIQIVSDRI IHCSVNESLGAAVGQLPI T IQVGNFN 12 5 7 

10 79 QTIATLQLGGSETAIWSIVICSVLLLLSWALFVFCTKSRRAERYWQKTLLQMEEMESQ 113 8 

I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1258 QTIATLQLGGSETAIIVSIVICSVLLLLSWALFVFCTKSRRAERYWQKTLLQMEEMESQ 1317 



1139 IREEIRKGFAELQTDMTDLTKELNRSQGIPFLEYKHFVTRTFFPKCSSLYEERYVLPSKT 119 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I 

1318 IREEIRKGFAELQTDMTDLTKELNRSQGIPFLEYKHFVTRTFFPKCSSLYEERYVLPSQT 13 7 7 

1199 LNSQGGSPPQETHPLLGEWNIPEHCRPSMEEGI SLFS SLLNNKHFL I VFVHALEQQKDFA 12 5 8 

I I I I I I I I I I I I I I I I III I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 7 8 LNSQGSSQAQETHPLLGEWKIPESCRPNMEEGI SLFS SLLNNKHFL I VFVHALEQQKDFA 143 7 

12 59 VRDRC S LAS LLT I ALHGKLEYYTS IMKELLVDL I DAS AAKNPKLMLRRTE SWEKMLTNW 1318 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
143 8 VRDRC S LAS LLT I ALHGKLEYYTS IMKELLVDL I DASAAKNPKLMLRRTE SWEKMLTNW 149 7 

1319 MSICMYGCLRETVGEPFFLLLCAIKQQINKGSIDAITGKARYTLNEEWLLRENIEAKPRN 13 7 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

149 8 MSICMYSCLRETVGEPFFLLLCAIKQQINKGSIDAITGKARYTLNEEWLLRENIEAKPRN 155 7 

13 79 LNVSFQGCGMDSLSVRAMDTDTLTQVKEKILEAFCKNVPYSQWPRAEDVDLEWFASSTQS 143 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
155 8 LNVSFQGCGMDSLSVRAMDTDTLTQVKEKILEAFCKNVPYSQWPRAEDVDLEWFASSTQS 1617 

1439 YVLRDLDDTSWEDGRKKLNTLAHYKIPEGASLAMSLTDKKDSTLGRVKDLDTEKYFHLV 149 8 
I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I 

1618 YILRDLDDTSWEDGRKKLNTLAHYKIPEGASLAMSLIDKKDNTLGRVKDLDTEKYFHLV 16 77 

1499 LPTDELVEPKKSHRQSHRKKVLPEIYLTRLLSTKGTLQKFLDDLFKAILSIREDKPPLAV 155 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
16 78 LPTDELAEPKKSHRQSHRKKVLPEIYLTRLLSTKGTLQKFLDDLFKAILSIREDKPPLAV 173 7 

1559 KYFFDFLEEQAEKRGISDPDTLHIWKTNSLPLRFWVNILKNPQFVFDIEKTDHIDACLSV 1618 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I 
173 8 KYFFDFLEEQAEKRGISDPDTLHIWKTNSLPLRFWVNILKNPQFVFDIDKTDHIDACLSV 179 7 

1619 IAQAFIDACSISDLQLGKDSPTNKLLYAKEIPEYRKTVQRYYKQIQDMTPLSEQEMNAHL 16 78 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

179 8 IAQAFIDACSISDLQLGKDSPTNKLLYAKEIPEYRKIVQRYYKQIQDMTPLSEQEMNAHL 1857 

16 79 AEESRKYQNEFNTNVAMAEIYKYAKRYRPQIMAALEANPTARRTQLQHKFEQWALMENN 173 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I 
185 8 AEESRKYQNEFNTNVAMAE I YKYAKRYRPQIMAALEANPTARRTQLQHKFEQWALMEDN 1917 

1739 IYECYSEA 1746 

I I I I I I I I 
1918 IYECYSEA 1925 



